Các kiểu dữ liệu Thống_kê

Các biến thử khác nhau đã được tạo ra để phân loại mức độ đo lường. Các nhà tâm lý Stanley Smith Stevens đã xác định thang đo danh nghĩa, thứ tự, khoảng thời gian và tỷ lệ đo. Thang đo danh nghĩa không có thứ tự xếp hạng có ý nghĩa trong các giá trị, và cho phép chuyển đổi một-một. Thang đo thứ tự có sự khác biệt chính xác giữa các giá trị liên tiếp, nhưng có một thứ tự có ý nghĩa giá trị và cho phép bất kỳ chuyển đổi nào để chuyển đổi. Đo khoảng thời gian có ý nghĩa và khoảng cách giữa các phép đo được xác định, nhưng giá trị bằng không là tùy ý (như trong trường hợp số dôi kinh độ và độ C hoặc độ F), và cho phép bất kỳ chuyển đổi tuyến tính. Đo tỷ lệ có cả một giá trị số không có ý nghĩa và khoảng cách giữa các phép đo khác nhau được xác định, và cho phép chuyển đổi sang sự thay đổi tỷ lệ.

Vì các biến chỉ phù hợp cho thang đo danh nghĩa hoặc thang đo thứ tự, không thể đo lường một cách hợp lý về số lượng, đôi khi chúng được nhóm lại với nhau như các biến phân loại, trong khi thang đo tỷ lệ và thang đo thời gian được nhóm lại với nhau như là các biến định tính, những biến có thể rời rạc hoặc liên tục do tính chất số lượng. Chúng thường được phân biệt như vậy thường ít tương quan với các dữ liệu trong nghiên cứu khoa học lưu trữ và phân tích thông tin được đưa vào. Trong đó các biến phân loại phân đôi có thể được đại diện với các kiểu dữ liệu Boolean (sử dụng hệ thống dữ liệu lý luận như AND, OR, NOT để xác định quan hệ giữa các thực thể), biến phân loại Polytomous với số nguyên....và các biến liên tục với các loại dữ liệu nghiên cứu khoa học lưu trữ và phân tích thông tin được đưa vào. Nhưng các bản đồ của các kiểu dữ liệu khoa học lưu trữ và phân tích thông tin đưa vào với các loại dữ liệu thống kê phụ thuộc vào phân loại sau khi được thực hiện.

Có nhiều phân tích khác đã được đề xuất. Ví dụ, Mosteller và Tukey (1977)[10] phân lớp, phân bậc, tính phân số, đếm, tổng số lượng và cân bằng. Nelder (1990)[11] mô tả tính liên tục, chỉ số liên tục, tính tỷ lệ và chế độ phân loại của dữ liệu. Cũng như Chrisman (1998)[12] và Van Den Berg (1991)[13].

Vấn đề có thích hợp hay không để áp dụng các loại khác nhau của các phương pháp thống kê số liệu thu được từ các loại khác nhau của các phương pháp đo lường phức tạp do các vấn đề liên quan đến việc chuyển đổi các biến và giải thích chính xác các câu hỏi đặt ra nghiên cứu. “mối quan hệ giữa các dữ liệu và những gì dữ liệu mô tả đơn thuần phản ánh một thực tế là một số loại báo cáo thống kê có thể có giá trị chân lý đó không phải là bất biến theo một số biến thay đổi. Có hay không một sự chuyển đổi hợp lý để chiêm ngưỡng phụ thuộc vào câu hỏi ai đang cố gắng để trả lời”. (Hand, 2004, p. 82)[14]